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570100; 


fi 2: [目的 /意义 ] 随 着 国家 扶贫 政策 和 乡村 振兴 战略 的 提出 ， 留 守 儿 童 教育 问题 引起 了 学 者 们 的 特别 关注 。 然 而 ， 留 守 
儿童 教育 的 研究 文献 是 零星 和 分 散 的 ， 需 要 系统 性 的 探讨 。 该 研究 的 目的 在 于 揭示 留守 儿童 教育 研究 成 果 的 主题 内 容 及 其 演 
化 规律 ， 以 为 政策 制定 和 实践 提供 更 深入 的 理论 支持 。[ 方 法 / 过 程 ] 该 研究 以 2002 年 至 2023 年 期 间 发 表 的 2 037 篇 

献 摘要 文本 构建 语料库 ， 使 用 了 基于 结构 主题 模型 方法 对 语料库 进行 主题 建 模 ， 从 主题 多 样 性 和 动态 性 的 角度 来 研究 相关 的 
现存 文献 及 发 展 趋 势 。[ 结 果 / 结论 ] 通过 主题 建 模 的 分 析 ， 最 终 确 定 了 8 个 关键 研究 主题 ， 分 别 是 心理 健康 、 留 守 儿 童 产生 
的 前 因 、 应 对 策略 〈 宏 观 )、 监 护 类 型 、 在 此 基础 上 提出 了 未 
来 的 研究 方向 。 


IN 


综述 类 研究 、 家 庭 教育 、 媒 介 素 养 、 应 对 策略 (微观 )。 最 后 
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中 的 住房 、 子 女 教育 、 子 女 照 料 等 问题 较 难 解 决 ， 很 
多 农民 工 将 子女 留 在 农村 ，“ 农 村 留守 儿童 ”群体 未 
渐 形 成 中 。 教 育 部 统计 数据 显示 ，2021 年 中 国 小 学 、 


1 引 


Di} 


随 着 中 国 社 会 经 济 的 快速 发 展 ， 工 业 化 和 城市 化 
进程 的 不 断 推进 ， 城 市 创造 了 更 多 的 就 业 机 会 ， 自 20 
世纪 80 年 代 以 来 ， 农 村 劳动 力 不 断 向 城市 转移 ， 农 民 
工 群体 成 为 中 国 经 济 腾飞 不 可 或 缺 的 中 间 力 量 。 与 此 


初中 阶段 农村 留守 儿童 共计 1 198.65 万 人 。 农 村 留守 
儿童 缺失 家 庭 教 育 、 生 活 条 件 艰苦 导致 了 诸多 教育 问 
题 ， 如 受 教育 难 、 学 习 成 绩 差 、 辍 学 率 高 等 中。 中 国 一 
直 关 注 留 守 儿 童 问题 ， 出 台 了 《关于 加 强 农 村 留守 儿 


同时 ， 受 户籍 制度 、 经 济 水 平 的 限制 ， 农 民工 在 城市 。” 童 关 爱 保护 工作 的 意见 》， 并 在 十 四 五 规划 提出 : “ 完 
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PAS JLM RRA, UALS ATER AR” 0, 
育 不 仅 是 留守 儿童 自身 成 长 和 人 力 资 本 的 积累 手段 ， 
也是 巩固 农村 脱贫 攻坚 ， 阻 断 贫困 传递 的 重要 措施 ， 
是 实现 乡村 振兴 的 未 来 力量 。 

留守 儿童 的 教育 问题 也 引起 了 学 术 界 的 广泛 关注 ， 
对 现 有 文献 进行 更 深入 的 组 织 、 整 合 、 综 合 和 评估 将 
为 未 来 的 研究 和 更 具 凝 聚 力 的 研究 议题 莫 定 基础 。 目 
前 关于 文献 综述 研究 主要 有 3 类 : 外 传统 的 定性 综述 
方法 四 。 这 种 综述 研究 纳入 分 析 的 文章 数量 有 限 ， 依 赖 
作者 对 该 领域 的 积累 。 且 研究 结果 较为 主观 ， 缺 乏 可 


量 非 结构 化 数据 集合 中 的 主要 主题 或 趋势 。 文 本 格式 
的 学 术 论文 本 质 上 是 非 结构 化 的 ， 因 此 ， 越 来 越 多 的 
学 者 使 用 主题 建 模 来 研究 不 同 研究 领域 的 主要 话题 趋 
势 。Latent Dirichlet allocation (LDA) 是 最 常用 的 主题 
建 模 方法 ，HWANGW 运 用 LDA 主题 模型 对 1981 年 1 
月 至 2022 年 3 月 期 间 发 表 的 有 关 技 术 在 数学 教育 中 的 
应 用 的 2 433 篇 文献 进行 分 析 ， 从 所 选 文章 中 提取 关键 
术语 和 主题 ， 确 定 七 个 研究 主题 以 及 这 7 个 主题 呈现 
出 不 同 的 研究 趋势 (稳定 、 波 动 、 增 加 和 减少 ); 
ODDEN"!)X} 1916 年 以 来 在 Science Education 上 发 表 的 


复制 性 。@ 元 分 析 法 外 ,这 种 方法 仅 对 留守 儿童 的 定量 
人 研究 适用 。@@ 基 于 Citespace 的 可 视 化 分 析 方 法 四 。 这 
种 方法 产生 的 研究 结果 更 为 客观 ， 可 以 复制 ， 但 该 类 
方法 不 能 对 摘要 等 长 文本 信息 进行 挖掘 。 人 工 智能 和 
机 器 学 习 技 术 使 得 大 规模 处 理 文本 并 进行 深入 分 析 成 
为 可 能 ， 杜 燕 萍 m 运 用 LDA 主题 模型 对 教师 队伍 建设 
改革 政策 文本 进行 分 析 ， 挖 气 出 “激励 导向 ”“ 职 前 
培训 ”“ 师 德 师 风 建设 ”三 大 主题 ， 并 在 此 基础 上 提 
出 政策 建议 ; 董 伟 B 运 用 机 器 学 习 技术 对 高 等 教育 国际 
化 领域 研究 领域 的 文献 进行 主题 识别 与 演化 特征 分 析 ; 


文章 进行 主题 建 模 ， 挖 据 出 21 个 不 同 的 主题 ， 分 为 3 
个 主题 组 : 科学 内 容 主题 、 以 教学 为 中 心 的 主题 和 以 
学 生 为 中 心 的 主题 。 田 园 中 对 在 线 教学 评价 内 容 进 行 
主题 建 模 ， 构 建 了 在 线 教学 用 户 需求 指标 体系 。 
然而 ，LDA 主题 模型 有 很 大 的 局 限 性 。 一 方面 ， 
LDA 无 法 表示 文档 中 主题 和 词 随 协 变量 的 变化 ; 另 一 
方面 ，LDA 假设 主题 相互 独立 ， 不 允许 主题 之 间 存 在 
相关 性 。 为 了 克服 这 些 限制 ， 本 研究 采用 Roberts! FF 
发 的 结构 主题 模型 (Structural Topic Model, STM), 
STM 主题 模型 是 LDA 和 相关 主题 模型 的 扩展 ， 通 过 


王 宇 荣 外 运用 LDA 主题 模型 控 握 了 关于 留守 儿童 的 新 
闻 报 道 和 网 民 的 评论 ， 研 究 了 留守 儿童 媒介 形象 的 差 
异化 建构 。 由 此 可 见 ， 文 本 挖掘 和 机 器 学 习 技术 逐渐 
受到 教育 学 领域 的 接纳 和 重视 。 

在 此 背景 下 ， 我 们 的 研究 旨 在 通过 系统 的 文献 综 
述 ， 对 与 农村 留守 儿童 相关 的 教育 问题 形成 系统 而 全 
面 的 理解 。 我 们 识别 并 分 析 了 发 表 在 期 刊 上 2 037 篇 相 
关 文 献 的 摘要 文本 ， 应 用 基于 主题 模型 的 文本 挖掘 方 
法 来 揭示 这 一 庞大 文献 中 隐藏 的 语义 结构 和 主题 ， 并 
结合 中 国 的 情境 特点 提出 未 来 的 发 展 方 向 。 


HA 


主题 建 模 是 一 种 文本 挖掘 技术 ， 用 于 发 现 给 定 文 
本 集合 的 “隐藏 ”主题 结构 ， 可 以 快速 有 效 地 揭示 大 
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直接 估计 协 变量 对 主题 流行 度 或 主题 内 单词 使 用 的 影 
响 来 解决 LDA 的 局 限 性 。 与 LDA 相 比 ，STM 具有 3 
个 明显 的 区 别 。 首 先 ， 人 允许 主题 相关 ; 其 次 ， 每 个 文 
档 都 有 其 在 主题 上 的 分 布 作为 协 变量 的 函数 ; 第 三 ， 
在 一 个 主题 中 ， 单 词 分 布 也 可 能 因 协 变量 的 变化 而 发 
生变 化 。 先 验 分 布 是 通过 包含 额外 的 协 变量 值 来 “ 结 
构 化 ”的 。 由 于 包含 用 于 主题 分 布 建 模 的 文档 级 协 变 
量 ，STM 主题 模型 优 于 其 他 主题 建 模 方 法 。 

STM 主题 模型 最 近 才 被 引入 主题 建 模 家 族 ， 主 要 
应 用 于 社会 学 领域 。 汗 顺 玉 鸣 基于 结构 主题 模型 分 析 了 
“一 带 一 路 ”学 术 话 语 的 主题 、 变 迁 与 差异 ， 赵 蓓 外 对 
Twitter 中 发 表 的 关于 北京 冬 奥 会 的 文本 进行 结构 主题 
建 模 ， 分 析 了 社交 机 器 人 叙事 与 立场 偏向 。 目 前 ， 尚 
未 检索 到 STM 主题 模型 在 教育 领域 的 应 用 。 


2.2 结构 主题 模型 


STM 也 是 一 种 概率 生成 模型 ， 它 将 生成 的 文档 定 


义 为 具有 不 同 流行 度 的 隐藏 主题 的 混合 体 。 生 成 模型 
解释 了 特定 文档 是 通过 使 用 多 个 主题 的 数据 生成 过 程 
而 产生 的 。 对 于 一 个 语料库 ， 假 设 天 个 潜在 主题 形成 
一 个 潜在 语义 空间 ， 其 中 每 个 词 都 可 以 表示 为 K- 维度 
向 量 。 此 外 ， 每 个 主题 由 具有 不 同 流行 度 的 一 元 词 或 
二 元 词 混合 组 成 ， 这 意味 着 每 个 词 都 有 属于 特定 主题 
的 概率 。 在 这 种 情况 下 ， 对 于 一 篇 文档 ， 所 有 主题 的 
总 主题 比例 为 1， 对 于 特定 主题 ， 所 有 词 的 总 词 概率 也 
为 1。 最后， 可 以 使 用 根据 称 为 流行 度 的 相应 条 件 概率 
分 数 排名 的 前 个 词 来 总 结 这 些 潜 在 主题 。 

图 1 为 结构 主题 模型 (STM) 的 原理 图 ， 其 中 ， 
D, 代表 语料库 中 的 文档 ; T, 代表 语料库 潜在 的 主题 ; 
模型 参数 % 假定 STM 中 的 随机 变量 是 从 对 数 正 态 分 布 
中 提取 的 随机 变量 ; X 代表 协 变 量 ， 可 以 是 时 间 、 类 
别 等 ; B, 表示 主题 -词汇 的 分 布 ; w 表示 构成 主题 的 词 
汇 。 结 构 主 题 模型 STM 的 生成 是 一 个 复杂 的 过 程 ， 更 
多 的 技术 细节 请 参考 [9。 


Structure Topic Model 
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图 1 结构 主题 模型 (STM) 原理 图 


Fig.1 Structural topic model (STM) 


3 数据 与 方法 


3.1 研究 框架 


为 了 进行 这 项 研究 ， 我 们 采用 结构 主题 模型 


e 数据 预 处 理 
去 除 标点 符号 、 


e 数据 收集 
数据 库 选取 


检索 式 构建 数字 、 停 用 词 
文献 筛选 构建 专业 词 表 
获取 文献 数据 分 词 


构建 词 向 量 


E X, SMM, AAS, X dé 
中 国 农村 留守 儿童 教育 研究 二 十 年 一 一 基于 结构 主题 模型 


(STM) 对 与 农村 留守 儿童 教育 相关 的 文献 进行 建 模 ， 
以 形成 连贯 和 全 面 的 理解 。 图 2 为 本 研究 的 框架 。 


3.2 数据 收集 


本 文 使 用 中 国 知 网 (CNKI) 收集 已 发 表 的 关于 农 
村 留守 儿童 教育 的 期 刊 文献 数据 。 首 先 ， 构造 检索 式 : 
(TE 留守 儿童 沾 农 村 留守 儿童 ') AND (TIF 教育 ')) 
OR (( KY=' 留守 儿童 '+' 农村 留守 儿童 ') AND ( KY= 
教育 ') )， 在 标题 或 关键 词 中 搜索 “留守 儿童 /农村 留 
守 儿 童 ” 以 及 含有 “教育 ”的 文章 。 其 次 ， 对 检索 出 
的 结果 进行 逐一 审核 ， 删 除了 与 本 研究 无 关 的 记录 ， 
如 期 刊 征文 。 通 过 以 上 两 步 的 处 理 ， 共 检索 出 “农村 
留守 儿童 教育 ”相关 的 文献 2 037 篇 ， 并 将 文献 标题 、 
摘要 、 关 键 词 、 作 者 、 机 构 等 信息 存储 在 Excel 表格 
中 。 时 间 跨 度 从 2003 年 1 月 到 2023 年 1 月 的 20 年 。 
de 1 列举 了 发 表 论 文 数量 超过 10 篇 的 24 本 期 刊 。 


3.3 数据 预 处 理 


3.3.1 数据 清洗 

数据 预 处 理 的 首先 要 去 除 文本 中 标点 符号 、 数 字 
和 停 用 词 (如 “的 ”“ 因 此 ”“ 所 以 ”“ 本 文 ” 等 无 
意义 的 词汇 ) 。 本 研究 通过 Python 语言 编写 程序 ， 调 
用 《哈工大 停 用 词 表 》 进 行 数据 清洗 。 
3.3.2 专业 词 表 构 建 

构建 专业 词 表 的 目的 是 确保 专业 词汇 不 被 分 割 ， 
比如 将 “留守 儿童 ”一 词 添加 至 专业 词 表 ， 则 “留守 
儿童 ”一 词 不 会 被 程序 切 分 为 “留守 /儿童 ”两 个 词 。 
本 研究 根据 所 收集 文献 的 关键 词 和 留守 儿童 研究 领域 
常用 的 概念 构建 专业 词 表 ， 部 分 如 表 2 所 示 。 


e 最 优 主 题 数 量 e 知识 发 现 
困惑 度 出 版 趋势 


一 致 性 主题 结果 可 视 化 
可 解释 性 主题 网 络 构建 


图 2 研究 框架 


Fig.2 Research framework 
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R1 期 刊 分 布 
Table 1 Journal distribution 
序号 期 刊 名 称 论文 数量 /篇 序号 期 刊 名 称 论文 数量 /篇 
1 科学 咨询 (教育 科研 》 60 13 经 济 研究 导 刊 15 
2 才智 49 14 科教 文 汇 ( 中 旬刊 》 15 
3 农村 经 济 与 科技 43 15 科学 咨询 (科技 -管理 ) 15 
4 教育 教学 论坛 37 16 西部 素质 教育 14 
5 学 理论 31 17 WAC RS 94 LE 14 
6 法 制 与 社会 29 18 教育 观察 13 
7 亚太 教育 29 19 文学 教育 (下 ) 13 
8 现代 教育 科学 25 20 产业 与 科技 论坛 12 
9 现代 交际 23 21 科教 导 刊 “中 旬刊 》 12 
10 科技 信息 17 22 教育 评论 11 
11 教学 与 管理 16 23 教育 现代 化 11 
12 中 国教 育 学 刊 16 24 新 西部 11 
表 2 专业 词 表 (部 分 ) 较 特 殊 ， 在 建 模 前 需要 将 文本 进行 分 词 处 理 ， 在 词语 
Table 2 Glossary of terms (partial) 之 间 加 入 空格 ， 比 如 : “农村 留守 儿童 教育 问题 ”分 
ms Kita ms 关键 词 结果 为 “农村 留守 儿童 教育 问题 "。 本 研究 用 
' MR eu Python 编程 语言 ， 调 用 Jieba 库 完成 分 词 处 理 。 
pe eic 3.3.4. 词 向 量 构建 
3 心理 健康 23 健康 教育 、 T 
: n m EE 词 向 量 是 计算 机 程序 理解 文本 的 语义 的 基础 ， 需 
i MS a A 要 将 文本 进行 向 量化 表示 。 本 研究 采用 TF-IDF. ORG 
"MN " on 频率 - 道 文档 频率 ) 用 于 量化 每 个 术语 在 语料库 中 的 
7 农民 工 27 教育 策略 相对 重要 性 。 
8 监护 人 28 性 教育 7F_IDF 值 由 两 部 分 组 成 : 词 频 (TF) Rl CPUS 
i cane i 浙 农村 建设 率 (IDF)。7F 评 估 一 个 术语 的 出 现 频率 。 第 i 个 关键 
nli k diis 词 的 FF-71DF 值 可 以 通过 公式 (1) 和 公式 (2) 计算 。 
11 道德 教育 31 乡村 振兴 2 — > . 
> ma " alm 本 人 研究 使 用 RR 语言 “quanteda” 包 计算 TF-IDF 4H, 
13 社会 化 33 社会 支持 it (1) 
14 精准 扶贫 34 公共 政策 其 中 ，7F; 代表 第 i 个 关键 词 在 第 j 个 文档 中 的 频率 。 
15 学 前 教育 35 贫困 地 区 IDF, = log Nt +1 (2) 
16 音乐 教育 36 美术 教育 
17 城市 化 37 心理 教育 
18 安全 教育 38 教育 困境 3.4 最 优 主 题 数 量 
ee j aia STM RER 4p 9d BORK, MRE K 的 值 是 
20 临时 监护 人 40 社区 教育 
为 了 实现 对 模型 结果 的 实质 性 解释 ， 而 不 是 为 了 模型 
333 分 词 的 最 大 化 拟 合 上 四。 一 致 性 和 排他 性 是 模型 结果 解释 能 


英文 文本 以 空格 作为 单词 的 分 
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w, ， 但 中 文 文本 比 


力 的 两 个 关键 指标 。 高 一 致 性 表明 主题 中 的 热门 词 在 
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中 


H 


E X, St, ARF, 刘 dE | 


文档 中 同时 出 现 的 可 能 性 较 高 ， 高 排他 性 意味 着 该 主 ” 较 高 。 最 终 ， 我 们 选择 了 主题 数量 为 8， 因为 这 种 设置 
题 的 高 概率 词 通常 不 会 出 现在 其 他 主题 中 四。 本 研究 ”可 以 产生 语义 上 一 致 性 和 排他 性 以 及 可 解释 性 最 强 的 
运用 及 语言 STM 包 对 语料库 进行 主题 建 模 ， 提 取 了 主 HR, 
题 数 量 K 从 3 到 20 共计 18 个 模型 的 一 致 性 和 排他 性 
评分 ， 具 体 结果 绘制 在 图 3。 

从 图 3 中 可 以 看 出 ， 当 主题 数量 较 大 时 ， 模 型 表 
现 出 较 高 的 排他 性 和 较 低 的 语义 一 致 性 ， 集 中 在 图 3 
左上 区 域 ， 当 主题 数量 较 小 时 ， 模 型 表现 出 较 低 的 排 
他 性 和 较 高 的 语义 一 致 性 ， 集 中 在 图 3 右 下 区 域 ; CH 图 4 描绘 了 年 度 发 表 的 期 刊 文章 和 包含 报纸 、 会 
主题 数量 为 6~9 时 ， 模 型 的 语义 一 致 性 和 排他 性 均 比 。 议 的 文章 总 量 ， 可 以 观察 到 自 2004 年 以 来 留守 儿童 教 


4.1 描述 性 结果 
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语义 一 致 性 (Semantic coherence) 
图 3 模型 语义 一 致 性 与 排他 性 


Fig.3 Model semantic consistency and exclusivity 
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Fig.4 Annual distribution of papers published on education for rural left-behind children 
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育 研究 的 快速 增长 。2003 年 在 期 刊 上 发 表 首 篇 与 留守 
儿童 教育 的 文章 2013 年 增长 到 170 篇 达到 峰值 ， 随 后 
出 现 回落 。2014 年 之 前 ， 期 刊 文献 和 总 文献 数量 趋势 
保持 一 致 ，2014 年 之 后 ， 期 刊 文献 数量 逐渐 减少 ， 包 


与 父母 分 离 时 处 于 身心 发 展 的 重要 阶段 ， 心 理 健康 问 
题 是 农村 留守 儿童 教育 中 普遍 存在 的 问题 外 。 刘 红 艳 外 
研究 发 现 ， 父 母 外 出 务工 4 个 月 以 上 会 对 留守 儿童 的 
心理 健康 产生 负面 影响 ， 父 母 返 乡 会 缓解 部 分 负面 影 


含 报纸 、 会 议 的 总 发 文 量 继续 增加 ， 至 2019 年 达到 峰 
值 527 篇 ， 随 后 迅速 下 降 。 


4.2 结构 主题 模型 结果 


STM 根据 语义 关联 将 文档 语料库 中 的 特定 关键 词 
分 配 到 潜在 主题 ， 在 这 种 情况 下， 每 个 主题 都 可 以 用 
小 部 分 关键 词 来 概括 。 为 了 确定 每 个 主题 的 具体 内 容 ， 
我 们 提取 了 与 每 个 主题 相关 的 前 20 个 关键 词 ， 具 体 结 
ATER 3 中 呈现 。STM 主题 模型 确定 了 与 留守 儿童 教 
育 问题 相关 的 8 个 研究 主题 ， 进 一 步 归 纳 为 7 个 类 别 ， 
分 别 是 : 心理 健康 、 留 守 儿 童 产 生 的 前 因 、 应 对 策略 
(主题 3、 主题 8) 、 监 护 类 型 、 综 述 类 研究 、 家 庭 教 
育 、 媒 介 素 养 。 
心理 健康 
主题 1 涉及 留守 儿童 的 心理 健康 问题 。 留 守 儿 童 


表 3 STM 主题 模型 结果 


响 ， 但 无 法 修复 处 于 青春 期 的 留守 儿童 的 心理 问题 。 
ERAN 5 个 不 同 经 济 带 的 1 066 名 留守 儿童 为 样 
本 ， 将 儿童 心理 健康 按照 积极 - 消极 、 内 化 - 外 化 划分 
为 4 个 维度 ， 研 究 发 现 留守 儿童 在 积极 心理 健康 维度 ， 
如 生活 满意 度 、 快 乐 感 等 维度 均 低 于 非 留 守 儿 童 。 
守 儿 童 的 心理 健康 也 会 受 经 济 条 件 的 影响 ,贫困 地 区 
的 留守 儿童 心理 健康 水 平 较 低 。 留 守 经 历 也 会 对 心理 
健康 产生 长 期 效应 ， 杨 雪上 岭 外 研究 发 现 ， 有 留守 经 历 
的 大 学 生 心 理 韧 性 水 平 可 能 较 低 ， 存 在 较 高 的 自杀 风 
险 。 心 理 干预 已 被 证 实 是 提升 留守 儿童 心理 健康 水 平 
的 有 效 手段 ， 白 勤 外 涉及 并 实施 了 “4+1” 培 养 干 预 模 
XX, 显著 提升 留守 儿童 心理 健康 水 平 。 
4.2.2 留守 儿童 现象 产生 的 前 因 

主题 2 涉及 到 留守 儿童 现象 产生 的 前 因 。 农 村 劳 
动力 转移 、 城 乡 二 元 体制 是 造成 留守 儿童 现象 的 直接 


By 
FH 


Table 3 Classification results based on STM topic model 


、 社 会 主义 、 加 快 、 


2023 年 第 35 卷 第 9 期 


剩余 劳动 力 、 改 革 、 和 谐 社 会 、 未 来 、 户 籍 制度 、 


主题 序号 研究 主题 关键 词 

主题 1 心理 健康 心理 健康 、 农 村 、 学 生 、 心 理 、 知 识 、 干预 、 性 教育 、 情 感 教育 、 留 守 儿 童 、 青 春 期 、 生 命 教育 、 安 全 教育 
非 留守 儿童 、 和 生命、 积极、 案件、 青春 期 ， 对 照 组 、 活 动 、 老 师 

主题 2 留守 儿童 产生 的 前 因 ”务工 、 进 城 、 期 望 、 农 民工 、 子 女 、 限 制 、 农 民 、 城 市 、 不 得 不 、 条 件 、 市 场 经 济 、 只 能 、 涌 向 、 离 开 、 大 
批 、 子 女 教 育 、 未 成 年 、 留 在 、 隔 代 教 育 、 家 乡 

主题 3 应 对 策略 〈 微 观 ) 帮 扶 、 精 准 扶贫 、 机 制 、 建 立 、 体 系 、 治 理 、 寄 宿 制 学 校 、 乡 村 振兴 、 社 区 教育 、 创 新 、 责 任 、 扶 贫 、 教 育 
扶贫 、 服 务 体系 、 多 方 、 教 育 公 平 、 关 爱 教 育 、 教 育 资源 、 政 府 、 职 能 

主题 4 监护 类 型 一 方 、 缺 少 、 长 期 、 双 方 、 父 母 、 外 出 、 母 杀 、 孩 子 、 父 灯 、 照 顾 、 呵 护 、 外 出 务工 、 未 成 年 人 、 远 离 、 分 
Hi. ASI, AD. BRR. ARE. ESD 

主题 5 综述 类 研究 对 策 、 问 题 、 原 因 、 引 起 、 社 会 各 界 、 关 注 、 解 决 、 冰 述 、 广 泛 、 分 析 、 存 在 、 现 状 、 措 施 、 探 讨 、 社 会 转 
型 、 以 期 、 普遍、 已经 、 解 决 问题 、 成 因 、 建 议 

主题 6 家 庭 教育 思想 、 道 德 、 家 庭 教育 、 缺 位 、 不 良 、 弱 人 化、 观念、 文化、 人格、 弥补、 表现 、 性 格 、 学 校 教育 、 缺 失 、 习 
惯 、 社 会 化 、 思 想 道 德 、 培 养 、 意 识 、 价 值 观 

主题 7 媒介 素养 媒介 、 大 学 生 、 社 会 工作 、 媒 介 、 电 视 、 访 谈 、 文 献 、 手 机 、 介 入 、 高 校 、 媒 介 素养 、 调 研 、 维 度 、 支 教 、 
梳理 、 实 证 、 工 具 、 技 术 、 媒 体 、 信 息 化 

主题 8 应 对 策略 (宏观 ) 转移 、 学 前 教育 、 人 口 、 劳 动力 、 大 规模 、 进 程 、 教 育 权 、 新 农村 建设 、 现 代 化 、 城 市 化 、 城 乡 二 元 、 经 济 


就 业 


原因 加， 不 可 忽视 的 是 ， 经 济 压力 大 、 子 女 教 育 难 、 
自身 流动 性 等 是 农民 工 选择 将 子女 留 在 家 乡 的 根本 原 
因 。 在 一 项 对 留守 儿童 父母 选择 将 子女 留守 在 家 原因 
的 调查 中 发 现 ，63.7% 是 因为 “家 庭 经 济 压力 重 ”%); 
学 费 贵 、 生 活 成 本 高 、 工 作 时 间 紧 张 、 流 动 性 大 等 也 
是 农民 工 没有 选择 将 孩子 带 在 身边 的 主要 原因 上 四。 
4.2.3 应 对 策略 

主题 3 和 主题 8 均 体 现 了 留守 儿童 教育 问题 的 应 
对 策略 。 为 了 更 深入 的 挖掘 两 者 的 差异 ,我 们 计算 两 
个 主题 关键 词 的 概率 差异 并 进行 可 视 化 ， 图 5 体现 了 
二 者 的 词汇 差异 。 可 以 发 现 ， 主 题 3 主要 关注 如 何 解 
决 当前 留守 儿童 教育 问题 ， 关 注 的 角度 更 加 微观 ; E 
题 8 注 的 角度 更 加 宏观 ， 关 注 农村 未 来 的 建设 和 发 展 。 
任 运 昌 外 基于 13 年 的 跟踪 研究 ， 提 出 留守 儿童 教育 问 
题 的 应 对 策略 和 缓解 策略 ， 面 对 当前 留守 儿童 的 教育 
问题 ， 应 该 落实 政府 行动 主体 的 责任 ， 开 展 “ 社 区 共 
育 ”“ 结 对 帮 扶 ”“ 还 原 家 教 ”“ 家 校 一 体 ” 的 工作 
模式 ; 与 此 同时 ， 系 统 改善 农村 文化 生态 环境 ， 防 止 
留守 儿童 “ 污 名 化 ”"， 落 实 法 律 保护 与 法 制 教育 ， 加 强 
农村 教师 队伍 建设 ,构建 以 寄宿 制 学 校 为 中 心 的 教育 
监护 体系 才 是 解决 农村 教育 问题 重 中 之 重 。 在 社会 各 
界 关 注 和 应 对 留守 儿童 问题 的 过 程 中 ， 也 有 学 者 敏锐 
的 发 现 留守 儿童 的 “ 污 名 化 ”， 认 为 留守 儿童 和 非 留守 
儿童 并 无 区 别 ， 而 是 成 长 环境 造成 的 差异 ， 是 当前 的 
社会 结构 产生 了 大 量 的 留守 儿童 ， 需 要 从 源头 解决 产 
生 留 守 儿 童 的 社会 结构 问题 、 呼 吁 实现 城乡 协同 、 乡 


村 振兴 、 权 利平 等 、 让 留守 儿童 的 父母 在 家 乡 就 能 安 
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图 5 主题 3 与 主题 8 词汇 差异 


Fig.5 Vocabulary differences between topic 3 and topic 8 
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居 乐 业 ， 让 农村 留守 儿童 不 再 “留守 ”外 。 
4.2.4 留守 儿童 监护 类 型 

主题 4 为 留守 儿童 监护 类 型 。 叶 敬 忠 外 对 中 西部 
10 个 农村 社区 的 留守 儿童 的 监护 情况 进行 调查 ， 将 留 
守 儿 童 的 监护 类 型 分 为 单亲 监护 (E / 母亲 一 方 监 
护 )、 隔 代 监 护 (4849. 3S. PREX. IMESH i 
护 )、 上 代 监 护 ( 亲 威 、 老 师 等 成 年 人 监护 ) 及 同辈 监 
(ARIA er er, IKEI, 或 独居 ) 4 种 监护 类 
型 。 范 兴 华 外 对 593 名 留守 儿童 和 353 名 父母 共同 监 
护 的 儿童 进行 研究 ， 发 现 隔 代 监 护 、 上 代 监 护 的 留守 
儿童 的 违纪 、 多 重 行为 、 行 为 适应 困难 等 问题 行为 维 
度 高 于 父母 监护 的 一 般 儿 童 。 留 守 儿 童 的 不 同 监护 类 
型 也 会 对 留守 儿童 的 心理 健康 产生 不 同 的 影响 四 。 
4.2.5 综述 类 研究 

主题 5 主要 体现 了 综述 类 的 研究 。 该 类 研究 对 现 
有 的 文献 进行 梳理 ,分 析 留 守 儿 童 教育 问题 产生 的 前 
因 后 果 以 及 应 对 策略 。 我 们 已 经 在 引言 部 分 将 现 有 的 
关于 留守 儿童 教育 问题 的 综述 研究 分 为 3 类 : 传统 的 
定性 综述 方法 、 元 分 析 法 和 基于 Citespace 的 可 视 化 分 
析 方 法 ， 在 此 不 再 更 述 。 
4.2.6 家 庭 教育 

主题 6 主要 讨论 留守 儿童 家 庭 教育 缺失 的 问题 。 
留守 儿童 面临 的 最 大 的 问题 是 家 庭 教育 的 缺失 ， 家 庭 
教育 与 儿童 的 人 格 、 品 格 、 性 格 等 息息相关 ， 留 守 儿 
章 家 庭 教 育 的 缺失 会 引起 学 习 成 绩 、 思 想 道 德 、 心 理 
素质 、 身 体 发 育 等 方面 出 现 问题 呈 。 家 庭 是 儿童 最 重 
要 的 社会 化 场所 上 四， 家庭 教育 的 缺失 会 加 大 同辈 群体 
对 留守 儿童 价值 观 和 社会 化 的 影响 ， 一 方面 ， 价 值 观 
的 形成 受 遗 传 因素 和 环境 因素 的 共同 作用 ， 由 于 缺乏 
父母 的 影响 ,留守 儿童 会 将 同龄 群体 的 行为 方式 作为 
评价 自己 和 他 人 的 标准 ， 作 为 自己 的 社会 观 和 价值 观 
MKT; 另 一 方面 ， 缺 乏 父 母 的 正确 引导 ， 留 守 儿 
童 容易 加 入 不 良 群体 、 在 社会 化 过 程 中 偏离 正确 的 价 
值 观 ， 从 而 导致 不 良 行 为 甚至 违法 犯罪 的 发 生 中 。 家 
庭 教 育 在 儿童 成 长 过 程 中 发 挥 着 非常 重要 的 功能 ， 面 
对 留守 儿童 面临 家 庭 教育 缺失 的 现实 问题 ， 相 关 研 究 
呼吁 学 校 教育 帮助 留守 儿童 构建 精神 世界 ， 树 立正 确 
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的 道德 管 和 价值 观 。 随 着 农村 规模 学 校 和 寄宿 制 学校 
的 增多 ， 学 校 和 老师 成 为 留守 儿童 成 长 的 主要 环境 和 陪 
伴 者 ， 将 会 在 留守 儿童 的 精神 世界 发 挥 更 大 的 作用 外。 
4.2.7 媒介 素养 

媒介 素养 是 指 对 媒介 内 容 所 形成 的 认 知 、 处 理 和 
参与 能 力 ， 媒 介 是 儿童 社会 化 发 展 的 一 个 重要 影响 因 
素 外 ， 电 视 、 电 脑 、 手 机 等 是 留守 儿童 获取 学 习 和 生 
活 的 必要 信息 ， 与 父母 保持 交流 的 重要 窗口 ， 对 留守 
儿童 的 认 知 、 学 习 、 道 德 品质 、 人 际 关系 等 均 有 重要 
影响 外 。 数 字 化 环境 下 ， 农 村 留守 儿童 的 媒介 素养 备 
受 关注 ， 研 究 发 现 农村 留守 儿童 普遍 缺乏 媒介 素养 知 
识 ， 家 庭 媒 介 环 境 较 为 单一 ， 学 校 有 关 媒 介 素 养 的 教 
育 和 设施 比较 缺乏 中， 媒介 素养 已 被 证 实 与 留守 儿童 
的 学 习 能 力 正 相 关外 。 随 着 计算 机 技术 的 发 展 ， 智 能 
手机 已 经 走 进 部 分 留守 儿童 的 生活 ， 视 频 、 语 音 、 图 
像 等 沟通 方式 的 普及 使 得 留守 儿童 与 父母 形成 了 便 提 
稳定 的 情感 沟通 渠道 ， 可 以 弥补 留守 儿童 社会 化 过 程 
中 家 庭 教 育 缺失 的 部 分 负面 影响 。 王 清华 中 研究 发 现 ， 
智能 手机 通过 “数字 代 偿 ”机 制 在 一 定 程度 上 弥补 留 
守 儿 童 家 庭 氛 围 、 教 育 和 互动 等 方面 的 不 足 ， 使 在 他 
乡 的 在 虚拟 情境 下 参与 留守 儿童 情感 社会 化 的 过 程 ， 
但 并 不 能 完全 弥补 父母 的 陪伴 。 
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43 主题 发 展 趋势 


结构 主题 模型 的 主要 优点 之 一 是 可 以 研究 协 变量 
和 主题 之 间 的 相互 作用 。 通 过 将 文献 的 刊 出 年 份 设置 
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为 协 变量 ， 可 以 比较 主题 随时 间 的 变化 趋势 。 所 有 主 
题 随时 间 动 态 如 图 6 所 示 ， 可 以 看 到 每 个 话题 的 热度 
变化 。 过 去 20 年 中 ， 主 题 1 (心理 健康 ) 、 主 题 3 (应 
对 策略 : 微观 )、 主 题 7 (媒介 素养 ) 呈 上 升 趋势 ， 主 
题 2 (前 因 )、 主 题 6 (ZEAR) 热度 基本 不 变 ， 主 
题 4 (监护 类 型 )、 主 题 5 (综述)、 主 题 8 (应 对 策略 : 
宏观 ) 呈 下 降 趋 势 。 根 据 该 图 ， 可 以 识别 热点 和 冷 话 
题 。 热 门 话题 具有 增加 趋势 ,冷门 话题 具有 减少 趋势 。 
未 来 可 以 进一步 分 析 这 些 变化 趋势 产生 的 原因 。 


5 结果 与 讨论 


5.1 研究 结果 


留守 儿童 教育 领域 目前 进行 了 大 量 的 研究 工作 ， 
学 术 文 章 数量 众多 ， 因 此 准确 识别 主要 研究 主题 和 趋 
势 是 一 项 耗 时 且 具 有 挑战 性 的 任务 。 本 研究 使 用 结构 
主题 模型 (STM) 对 留守 儿童 教育 领域 的 文献 进行 综 
述 ， 涵 盖 777 种 期 刊 的 2 037 篇 论文 ， 时 间 跨 度 从 
2002 年 1 月 到 2023 年 1 月 。 本 研究 呈现 了 留守 儿童 教 
育 研 究 的 整体 概览 和 知识 结构 。 基 于 主题 模型 的 语义 
一 致 性 和 排他 性 确定 了 8 个 研究 主题 ， 并 将 文献 的 发 
表 年 份 作为 协 变量 确定 主题 的 演化 趋势 。 

结果 表明 ， 留 守 儿 童 教育 领域 的 学 术 关 注 与 留守 
儿童 产生 的 前 因 、 后 果 和 作用 机 制 有 关 ， 在 过 去 的 20 
年 里 ， 心 理 健康 、 应 对 策略 、 媒 介 素 养 3 个 主题 的 研 
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图 6 主题 变化 趋势 
Fig.6 Trend oftopic changes 
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究 趋势 不 断 上 升 。 未 来 的 研究 应 重点 关注 留守 儿童 家 

教育 的 缺失 带 来 的 问题 ,通过 政府 、 学 校 、 社 区 、 
庭 的 共同 努力 ， 为 留守 儿童 营造 更 良好 的 生存 环境 。 
综合 以 上 研究 结果 ， 可 以 看 出 留守 儿童 教育 涉及 
的 主题 多 样 且 动态 变化 。 心 理 健康 问题 是 留守 儿童 教 
育 研究 中 的 一 大 关注 点 ， 研 究 者 们 认识 到 留守 儿童 在 
心理 健康 方面 面临 的 风险 ， 并 通过 探讨 心理 健康 问题 
的 原因 、 影 响 因素 和 干预 策略 等 ， 为 留守 儿童 的 心理 
健康 提供 了 理论 和 实践 支持 。 

此 外 ， 研 究 者 们 也 关注 了 留守 儿童 产生 的 前 因 ， 
包括 经 济 、 家 庭 、 社 会 等 多 层面 的 因素 ， 认 识 到 留守 
儿童 问题 的 根本 原因 较为 复杂 ， 需 要 综合 多 方面 的 因 
素 进行 研究 和 干预 。 

在 应 对 策略 方面 ， 研 究 者 们 从 宏观 和 微观 两 个 层 
面 进行 了 人 研究。 宏观 层面 包括 政府 、 社 会 组 织 和 学 校 
等 的 应 对 策略 ， 如 政策 制定 、 社 会 服务 体系 建设 和 学 
校 支 持 等 。 微 观 层面 包括 留守 儿童 自身 的 应 对 策略 ， 
如 情绪 调节 、 自 我 管理 和 社交 能 力 等 。 这 些 研究 为 留 
守 儿 童 教育 提供 了 多 层面 、 多 维度 的 干预 和 支持 策略 ， 
有 助 于 促进 留守 儿童 的 全 面 发 展 和 健康 成 长 。 


NOR d 


5.2 未 来 展望 
基于 对 现 有 文献 的 综述 和 分 析 ， 未 来 的 研究 可 以 
从 以 下 几 个 方向 展开 。 


深入 研究 留守 儿童 心理 健康 问题 。 进 一 步 深入 探 
究 留 守 儿 童心 理 健康 问题 的 机 制 、 风 险 因 素 和 保护 因 
素 ， 包 括 心理 健康 评估 、 心 理 健 康 干 预 和 心理 健康 政 
策 的 研究 。 同 时 ， 也 可 以 考虑 心理 健康 问题 与 其 他 因 
素 如 家 庭 背景 、 社 会 文 持 和 文化 因素 的 相互 作用 ， 深 
化 对 留守 儿童 心理 健康 问题 的 理解 。 

深入 探究 留守 儿童 产生 的 前 因 。 进 一 步 深入 研究 
留守 儿童 产生 的 原因 ， 包 括 经 济 、 家 庭 、 社 会 等 多 层 
面 的 因素 ， 如 留守 儿童 家 庭 背 景 、 家 庭 教育 方式 、 社 
会 文化 背景 等 。 通 过 深入 研究 留守 儿童 产生 的 前 因 ， 
可 以 为 制定 针对 性 的 干预 策略 提供 更 为 科学 的 依据 。 

深入 研究 留守 儿童 的 应 对 策略 。 进 一 步 深入 研究 
留守 儿童 自身 的 应 对 策略 ， 包 括 情绪 调节 、 自 我 管理 、 
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社交 能 力 等 方面 的 研究 。 可 以 通过 多 种 研究 方法 如 心 
理 测量 、 实 证 研究 和 长 期 追踪 研究 等 ， 深 入 了 解 留守 
儿童 应 对 困境 和 道 境 的 方式 和 效果 ， 并 为 提供 有 针对 
性 的 干预 策略 提供 科学 依据 。 

强调 家 庭 教育 的 重要 性 。 留 守 儿 童 的 家 庭 环境 对 
其 教育 和 发 展 具有 重要 影响 。 未 来 研究 可 以 进一步 关 
注 留守 儿童 家 庭 教育 的 特点 、 问 题 和 干预 策略 ， 包 括 
家 庭 教育 方式 、 家 庭 支 持 、 亲 子 关 系 等 方面 的 研究 。 
同时 ， 可 以 考虑 将 家 庭 教育 纳入 到 留守 儿童 教育 干预 
的 综合 模式 中 ， 强 调 家 庭 教育 在 留守 儿童 教育 中 的 重 
要 性 。 

关注 媒介 素养 的 发 展 。 随 着 数字 化 媒体 的 普及 ， 
留守 儿童 在 媒体 环境 中 的 成 长 和 媒介 素养 的 发 展 也 日 
益 受 到 关注 。 未 来 研究 可 以 深入 探究 留守 儿童 在 媒体 
使 用 方面 的 行为 、 习 惯 和 影响 ， 包 括 社交 媒体 使 用 、 
网 络 游戏 行为 、 在 线 学 习 等 方面 的 研究 。 同 时 ， 可 以 
关注 留守 儿童 媒介 素养 的 培养 策略 和 效果 评估 ， 为 留 
守 儿 童 在 数字 化 媒体 环境 中 的 健康 成 长 提供 科学 依据 。 

深入 研究 监护 类 型 对 留守 儿童 的 影响 。 留 守 儿 童 
的 监护 类 型 对 其 教育 和 发 展 产 生 重 要 影响 。 未 来 研究 
可 以 深入 探究 不 同 监 护 类 型 对 留守 儿童 的 影响 ,包括 
父母 、 祖 父母 、 其 他 亲属 或 社会 机 构 等 监护 者 对 留守 
儿童 的 支持 、 照 顾 和 教育 方式 的 研究 。 同 时 ， 可 以 探 
讨 监 护 类 型 对 留守 儿童 心理 健康 、 学 校 适 应 、 社 会 适 
应 等 方面 的 长 期 影响 ， 并 提出 相应 的 干预 策略 。 

加 强 综述 类 研究 的 方法 和 应 用 。 综 述 类 研究 在 留 
守 儿 童 教育 研究 中 具有 重要 地 位 。 未 来 研究 可 以 进 一 
步 加 强 综 述 类 研究 的 方法 和 应 用 ， 包 括 系统 性 文献 回 
顾 、 荟 茶 分 析 、 元 分 析 等 方法 的 应 用 ， 从 而 更 全 面 地 
总 结 和 归纳 留守 儿童 教育 研究 的 现 有 成 果 ， 并 为 未 来 
研究 和 实践 提供 更 为 可 靠 和 有 力 的 证 据 。 

考虑 微观 层面 的 应 对 策略 。 除 了 宏观 层面 的 应 对 
策略 外 ， 留 守 儿 童 在 日 常生 活 中 也 会 运用 各 种 微观 层 
面 的 应 对 策略 。 未 来 研究 可 以 深入 探究 留守 儿童 在 日 
常生 活 中 的 应 对 策略 ， 包 括 个 体 层面 的 情绪 调节 、 自 
我 保护 、 社 交 支 持 等 方面 的 研究 。 这 将 有 助 于 更 好 地 
理解 留守 儿童 在 面 对 困 境 和 压力 时 的 实际 应 对 行为 ， 
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为 留守 儿童 提供 更 有 效 的 心理 健康 支持 和 干预 策略 。 
此 外 ， 未 来 研究 也 应 关注 留守 儿童 教育 政策 和 实 
践 的 评估 和 改进 ， 推 动 留守 儿童 教育 政策 的 落地 和 实 
施 ， 为 留守 儿童 提供 更 好 的 教育 和 发 展 机 会 。 同 时 ， 
跨 学 科 和 跨 领 域 的 研究 合作 也 是 未 来 研究 的 趋势 ， 如 
教育 学 、 心 理学 、 社 会 学 、 媒 体 学 、 社 会 工作 等 学 科 
之 间 的 合作 ， 以 促进 留守 儿童 教育 研究 的 深入 和 发 展 。 


5.3 研究 贡献 与 不 足 


本 研究 的 贡献 如 下 。 本 研究 使 用 基于 机 顺 学 习 方 
法 的 STM 主题 模型 对 文献 进行 挖掘 ， 可 以 克服 基于 
LDA 主题 模型 研究 的 局 限 性 。 人 工 智 能 的 方法 还 允许 
学 者 从 大 量 研究 论文 中 快速 获取 全 面 的 信息 。 本 研究 
通过 整合 文档 元 数据 信息 ， 进 一 步 系 统 地 揭示 了 主题 
随时 间 的 演化 趋势 ， 有 助 于 确定 随 着 时 间 的 推移 改变 
留守 儿童 教育 研究 重点 的 潜在 趋势 。 

然而 ， 该 方法 也 有 一 定 的 局 限 性 。 首 先 ， 在 本 文 
中 ， 我 们 从 文献 中 仅 收 集 了 文章 摘要 而 不 是 全 文 。 因 
此 ， 本 研究 中 得 到 的 这 些 主题 可 能 不 是 完整 研究 文章 
中 所 含 信息 的 完整 表示 。 未 来 可 以 基于 全 文本 挖掘 技 
术 对 留守 儿童 教育 领域 进行 更 深入 的 挖 据 。 其 次 ,在 
本 文 的 检索 中 ， 我 们 重点 考虑 了 “留守 儿童 ”“ 农 村 
留守 儿童 ”以 及 “教育 ”的 组 合 ， 这 会 损失 一 些 文献 ， 
如 以 “留守 子女 ”为 关键 词 的 研究 ， 未 来 ， 可 以 通过 
构建 机 融 学 习 分 类 模型 运用 可 解释 性 机 器 学 习 方 法 
对 论文 分 类 中 关键 词 的 选择 进行 甄选 四。 最 后 ， 本 研 
究 并 未 将 研究 生 学 位 论文 纳入 分 析 的 范畴 。 研 究 生 学 
位 论文 通常 会 修改 成 小 论文 进行 发 表 ， 与 期 刊 论文 存 
在 重合 ， 因 此 我 们 未 将 其 纳入 考虑 范围 。 然 而 ， 也 需 
注意 到 存在 一 些 高 质量 的 研究 生 学 位 论文 。 未 来 的 研 
究 可 以 考虑 基于 作者 - 论文 相似 度 的 计算 ， 将 未 被 修 
改 为 小 论文 发 表 的 学 位 论文 内 容纳 入 统计 分 析 中 。 
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Twenty Years of Left-Behind Children Education in Rural China: 
Based on Structural Topic Model 
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Abstract: [Purpose/Significance] The introduction of national poverty alleviation policies and rural revitalization strategies has thrust the 


issue of education for left-behind children into the spotlight of scholarly attention. Education, far beyond serving as a mere instrument 


for personal growth and human capital accumulation for left-behind children, emerges as a pivotal measure in consolidating rural poverty 


alleviation endeavors and breaking the transmission of intergenerational poverty in China. It stands as a vital force propelling the future 


of rural revitalization. Yet, the existing literature on the education of left-behind children remains sporadic and dispersed. A more 


profound organizational effort, integrating, synthesizing, and evaluating this scattered literature, is imperative to establish a foundational 


framework for future research, fostering more cohesive and focused research endeavors. Presently, literature review studies primarily fall 
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into three categories: qualitative review methods, meta-analysis, and bibliometric analysis methods employing tools like Citespace. This 
study sets out to achieve a systematic and comprehensive understanding of education-related issues for rural left-behind children through 
text mining methods grounded in topic models. [Method/Process] The advent of artificial intelligence and machine learning technologies 
has empowered the processing and analysis of vast amounts of textual data. Previous research, employing latent dirichlet allocation 
(LDA) topic models, successfully mined texts related to teacher team construction reform policies, internationalization in higher 
education literature, news reports, and online comments. In this study, a corpus was meticulously constructed using abstract texts 
extracted from 2037 journal articles published between 2002 and 2023. The structural topic model (STM) was chosen for topic 
modeling, overcoming the limitations associated with LDA, with a specific emphasis on exploring the diversity and dynamism of topics 
within the existing literature. [Results/Conclusions] The culmination of this research effort identified eight distinct research themes: 
psychological well-being, factors leading to left-behind children, macro-level coping strategies, types of guardianship, review studies, 
family education, media literacy, and micro-level coping strategies. By synergizing document metadata information, the study 
systematically unraveled the evolving trends of these topics over time, providing crucial insights into potential shifts in the focus of 
left-behind children's education research. It is essential to note that this study, while collecting abstracts instead of full texts, may not 
capture the entirety of information contained in complete research articles. Future research endeavors should explore left-behind 
children's education more comprehensively, leveraging full-text mining techniques for a more nuanced understanding of this critical 
subject. 


Keywords: left-behind children; topic model; structural topic model; information literacy 
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